شناسایی ژنوتیپ های ویروس هپاتیت سی با استفاده از الگوریتم های شناسایی الگو و سایرالگوریتم های داده کاوی

پایان نامه
چکیده

هپاتیت سی، به معنای التهاب و تورمی است که به علل مختلف در بافت کبد به وجود می آید و یکی از مشکلات عمده بهداشتی در سطح جهان است. بنابه گزارش مرکز بهداشت جهانی، شیوع این بیماری درحدود 3درصد است و تقریباً 170 میلیون نفر از جمعیت جهان به این ویروس آلوده هستند. ویروس هپاتیت سی دارای شش ژنوتیپ اصلی است که امکان درمان فرد مبتلا به ژنوتیپ یک کمتر از 50درصد است و در ژنوتیپ دوم و سوم این احتمال به بالای 80 درصد می رسد. بنابراین تشخیص نوع ژنوتیپ ابتلایی دربار? ویروس هپاتیت، قدم اول در تعیین پروسه درمانی است. در این تحقیق با استفاده از ابزارهای داده کاوی همچون الگوریتم پنجر? لغزان، مهم ترین مشخصه های ژنومی متمایزکننده براساس محل تکرارهای سه تایی بین ژنوتیپ های اول و دوم هپاتیت سی را براساس مدل های آماری وزن دهی،خوشه بندی، پیش بینی، القای درخت و قوانین انجمنی روی دو نوع داده ی اسمی و عددی بررسی کردیم. نتایج حاصل از وزن دهی روی پایگاه داده اسمی سه موقعیت 75 و 231 و60 و مدل وزن دهی روی پایگاه داده عددی موقعیت های 81 و 25 و 68 و70 و اطراف آن ها را به عنوان مهم ترین متغیر های ژنی عنوان کردند. در روش های خوشه بندی k-means و k-medoids بالاترین درصد دقت برای خوشه بندی 72درصد بوده که نسبت به سایر روش های داده کاوی نتایج مورد توجهی نداشته است. نتایج حاصل از روش های پیش بینی bayse kernle و naive bayse نشان داد که این مدل ها روی داده های عددی می توانند با دقت 98درصد دو ژنوتیپ ویروس هپاتیت سی را شناسایی کنند. در نتایج القای درخت دقیق ترین درخت دقتی برابر 15/98درصد و پرتکرارترین درخت دقتی بالای 90درصد داشت و همچنین موقعیت 25 ،4، 68و 81 بالاترین تکرار را در ریشه درختان داشتند. باتوجه به نتایج قوانین انجمنی روشfp-growth روی داده های ما بهتر عمل کرد؛ چون با ضریب اطمینان و پشتیبان نزدیک 100درصد توانست ناحیه 3209 تا 3220 را به عنوان یکی از مهم ترین ناحیه در ژنوم این ویروس که برای زنوتیپ اول و دوم بیشترین تغییرات را داشته معرفی کند. این نتایج برای اولین بار نشان دهنده نقش برخی از موقعیت های الگوهای سه تایی در شناسایی ژنوتیپ های ویروس هپاتیت سی است.

منابع مشابه

شناسایی ژنوتیپ های ویروس هپاتیت سی بر اساس الگوهای تکرارشونده

هپاتیت مزمن سی یکی از شایع¬ترین علل نارسایی مزمن کبد و پیوند کبد در جهان محسوب می شود. تقریباٌ 3 درصد جمعیت جهان یعنی بیش از 180 میلیون نفر آلوده به این ویروس هستند. احتمال پاسخ به درمان در بیماران بسته به ژنوتیپ ابتلایی متفاوت است. اگر فرد به ژنوتیپ نوع اول مبتلا شده باشد امکان درمان او کمتر از 50 درصد و طول دوره درمان 48 هفته است ولی در ژنوتیپ نوع دوم و سوم این احتمال به بالای 80 درصد می رسد و...

15 صفحه اول

شناسایی جهش های ژن NS5B ژنوتیپ 1a ویروس هپاتیت C در استان گیلان

سابقه و هدف: ویروس هپاتیت C عامل اصلی هپاتیت مزمن کبدی است که سالیانه باعث مرگ هزاران نفر در دنیا می گردد. پروتئین NS5B، RNA پلی مراز وابسته به RNA است که توسط ژن NS5B کد می شود و در همانندسازی ویروس نقش دارد. از جمله داروهای موثر در درمان این عفونت های ناشی از این ویروس مهارکننده های پروتئین NS5B می باشند. ظهور سویه های مقاوم به این داروها یک مانع بزرگ در موفقیت درمان...

متن کامل

کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره

تشخیص داده‌های خارج از ردیف چند متغیره به کمک الگوریتم‌های داده‌کاوی یکی از نکات ضروری پیش‌پردازش داده‌های اکتشافات ژئوشیمیایی محسوب می‌شود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روش‌های آماری، روش‌های مبتنی بر مجاورت، روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر دسته‌بندی هستند، معرفی شده و کاربرد آنها بر روی دا...

متن کامل

پیش بینی روش درمان بیماری قلبی با استفاده از الگوریتم های داده کاوی

Background and Aim: Nowadays heart disease is very common and is a major cause of mortality. Proper and early diagnosis of this disease is very important. Diagnostic methods and treatments of the disease are so expensive and have many side effects. Therefore, researchers are looking for cheaper ways to diagnose it with high precision. This study aimed to identify a model for the treatment of he...

متن کامل

مدلسازی رواناب ماهانه با استفاده از روشهای داده کاوی براساس الگوریتم های انتخاب ویژگی

باتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب­های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل­سازی بسیار مهم می‌باشد. در این تحقیق پس از آزمون همگنی داده‌های بارش، دما و رواناب ماهانه حوضه آبریز ناورود، ابتدا براساس دو الگوریتم رلیف و همبستگی دو ترکیب مختلف از پارامترهای موثر در رواناب مورد توجه قرار گرفت....

متن کامل

بررسی تاثیر متغیرهای کلان اقتصادی بر بازار سهام ایران با استفاده از الگوریتم های داده کاوی

امروزه بیشتر مطالعات در خصوص بازار سهام در اقتصاد ایران در قالب مطالعات اقتصاد سنجی بوده که در جای خود توانسته اند راهنمای سیاستگذاران باشند ولی الگوریتمهای داده کاوی توانایی مضاعفی در خصوص تدوین سیاست های راهبردی ارایه می دهند. با عنایت به نقش واهمیت بازار سهام در اقتصاد کشور، با استفاده از الگوریتم های داده کاوی نسبت به شناسایی متغیرهای مهم و تاثیر گذار بر رابطه بلند مدت شاخص کل قیمت سهام اقد...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023